统计学入门(10): 正态性、方差齐性及非参数检验
统计学入门(10): 正态性、方差齐性及非参数检验
引言
01
在当今数据驱动的研究领域,无论是探索自然科学的奥秘、解析社会科学的复杂性、还是优化工程技术的设计,数据分析都扮演着至关重要的角色。在本系列前面的文章中,我们了解了假设检验及Z检验、t检验、F检验。接下来,让我们来熟悉下正态性和方差齐性的概念、以及当数据不满足这些假设时如何应用非参数检验方法。
正态性
02
正态性(Normality)指的是数据分布的一种特定形态,即正态分布(又称高斯分布)。正态分布是最重要的连续型概率分布之一,在自然科学和社会科学的许多领域都有广泛应用。
正态分布的特点
对称性:正态分布的图形是关于其均值对称的钟形曲线。均值、中位数和众数在这种分布中是相同的,位于曲线的中心。
单峰性:正态分布的图形有一个明显的峰值,即数据最密集的区域位于均值附近。
渐近性:正态分布的曲线两端永远接近但不会触及横轴,意味着理论上正态分布的变量可以取任何值,但实际上远离均值的极端值出现的概率非常小。
由两个参数确定:正态分布由两个参数确定,这两个参数是均值(μ)和标准差(σ)。均值决定了分布的中心位置,标准差决定了分布的宽度,即数据的离散程度。
一般我们会采用可视化的方法(直方图)观察数据是否符合正态分布的钟形曲线,如下图所示。
图1 正态性
另外,也可以使用统计测试方法检验数据的正态性,如:
Shapiro-Wilk 测试:这是检验数据正态性的一种非常流行的方法,特别适用于样本量较小(通常n < 50)的情况。如果p值小于显著性水平(通常是0.05),则拒绝正态性的假设。
Kolmogorov-Smirnov 测试:这个测试适用于样本量较大的情况,通过比较样本分布与正态分布之间的差异。同样,如果p值小于显著性水平,则拒绝数据来自正态分布的假设。
许多统计测试(如t检验、方差分析)和估计方法(如置信区间的计算)假定数据或误差项呈正态分布。
方差齐性
03
方差齐性(Homoscedasticity)指的是在不同的群组、条件或时间点上,变量的方差保持一致的性质。这一假设在许多统计分析方法中都非常重要,特别是在进行线性回归分析、方差分析(ANOVA)等时,方差齐性是关键的假设之一。
如何检测方差齐性
方差齐性可以通过图形方法和统计测试来检测:
图形方法:绘制残差与预测值的散点图,观察残差的分布是否在各个水平上相似,见图2。
统计测试:例如Levene测试、Bartlett测试和Brown-Forsythe测试,这些测试可以提供是否有足够的证据拒绝方差齐性的假设。
图2为残差图,第一张图显示残差和拟合值没有任何相关关系。第二张图显示平均残差随拟合值(因此也随着x)不变,但残差的散布(y关于拟合线的散布)随着拟合值(或x)的变化而增加。也就是说,散布不是恒定的。这种现象称为异方差性。第三张图显示当拟合值较小时,残差大多为负;当拟合值处于中间时,残差为正;当拟合值较大时,残差又为负。也就是说,散布大致恒定,但条件均值不是——拟合线无法描述y随x变化的行为,因为这种关系是曲线的。
图2 方差齐性
假设我们要研究不同工作年限对员工薪资的影响。在这个研究中:
自变量(解释变量):员工的工作年限。
因变量(响应变量):员工的薪资。
进行线性回归分析时,方差齐性的假设意味着对于所有不同工作年限的员工群体,他们薪资的方差应该是相同的。换句话说,不论员工工作了1年、5年还是10年,他们薪资的波动程度(方差)应该是一致的。
假设我们收集了每组中员工的薪资数据,希望使用方差分析(ANOVA)来检验不同工作年限是否对薪资有显著影响。在这个过程之前,我们需要检验这三组数据是否满足方差齐性的假设。如果测试结果表明三组薪资的方差相等,我们就可以继续进行ANOVA分析;如果不满足方差齐性,可能需要对数据进行转换或采用不同的统计方法,如使用Welch的ANOVA代替传统的ANOVA。
非参数检验
05
非参数检验(nonparametric test)是不依赖于数据分布假设的检验方法,适用于数据不满足正态分布或其他分布假设,或者当数据是顺序(序数)数据而非数值(区间或比例)数据时。以下是几个常见的非参数检验方法:
1. 曼-惠特尼U检验(Mann-Whitney U Test)
适用场景:比较两个独立样本的中位数是否存在差异。适用于顺序数据或连续数据,特别是当数据不满足正态分布假设时。
样本量要求:理论上没有最小样本量要求,但较小的样本可能导致检验的统计功效不足。通常,每组至少需要5到10个观测值以获得较为可靠的结果。
例如,假设你想比较两种不同教学方法对学生考试成绩的影响,但成绩分布不满足正态分布。在这种情况下,可以使用曼-惠特尼U检验来判断两组学生的成绩是否有显著差异。
2. 威尔科克森符号秩和检验(Wilcoxon Signed-Rank Test)
适用场景:比较两个相关样本或配对样本的中位数是否存在差异。适合于连续数据或顺序数据,尤其当数据不符合正态分布时。
样本量要求:同样,没有严格的最小样本量要求,但为了保证足够的统计功效,每组样本量至少应有5到10个配对观测值。
例如,如果你有一组病人在治疗前后进行的疼痛评分数据,且数据不满足正态分布,你可以使用威尔科克森符号秩和检验来判断治疗是否有效地改变了疼痛评分。
3. 克鲁斯卡尔-瓦利斯检验(Kruskal-Wallis Test)
适用场景:比较三个或更多个独立样本的中位数是否存在差异。适用于不满足正态分布假设的连续或顺序数据。
样本量要求:每个独立样本组至少需要5个观测值是个较好的实践,但总样本量较大时,小组样本量可以更小。总体上,增加样本量可以提高检验的统计功效。
例如,研究三种不同种类的饮食对体重变化的影响。如果数据不符合正态分布的假设,可以使用克鲁斯卡尔-瓦利斯检验来判断不同饮食类型是否对体重变化有不同的影响。
4. 弗里德曼检验(Friedman Test)
适用场景:比较三个或更多个相关样本或重复测量数据的中位数是否存在差异。适合于重复测量数据或匹配数据,特别是当数据不满足正态分布假设时。
样本量要求:至少需要两个条件下的三个重复测量值,但样本量越大,检验的统计功效越高。
例如,评估同一组受试者在不同时间点(如早晨、中午、晚上)的心率变化。如果数据不符合正态分布或其他相关假设,可以使用弗里德曼检验来分析心率是否随时间的变化而显著变化。
应用非参数检验的考虑因素
非参数检验的优点在于它们对数据的分布假设较少,使得它们在处理非正态分布数据或等级数据时非常有用。然而,非参数检验的一个潜在缺点是它们通常不如相应的参数检验(如t检验)那样有统计效力,尤其是当数据实际上满足参数检验的假设时。因此,在选择使用非参数检验之前,应该先对数据进行分布的检验。
具体案例
05
假设我们要研究两种不同的教学方法对学生考试成绩的影响。研究设计包括两组:一组采用传统教学方法(对照组),另一组采用基于项目的学习方法(实验组)。每组各有150名学生,总样本量为300。我们的目标是比较两种教学方法在学生考试成绩上是否有显著差异。
实验步骤
1. 数据收集
对照组:150名学生接受传统教学方法。
实验组:150名学生接受基于项目的学习方法。
每位学生的考试成绩在实施不同教学方法后被记录。
2. 数据分析前的准备
首先,通过绘制箱线图和直方图,以及计算描述性统计量(如均值、中位数、标准差),来了解数据分布的基本情况。
3. 检验正态性
尽管样本量较大时中心极限定理通常意味着参数检验可能是适用的,但我们依然通过正态性检验(如Shapiro-Wilk测试)来确认数据是否满足正态分布的假设。
如果数据符合正态分布,可以考虑使用独立样本t检验。
如果数据不符合正态分布,应使用非参数检验。
4. 方差齐性检验
如果选择进行t检验,则还需要进行方差齐性检验(如Levene's test)。如果检验结果表明方差不齐,则需要调整t检验的方法(如使用Welch的t检验)。
5. 选择合适的检验方法
如果数据满足正态分布和方差齐性:进行独立样本t检验。
如果数据不满足正态分布:进行曼-惠特尼U检验。
6. 进行统计检验
以数据不满足正态分布为例,我们使用曼-惠特尼U检验来比较两种教学方法对学生考试成绩的影响。
7. 结果解释
根据曼-惠特尼U检验的p值,判断两种教学方法在学生考试成绩上是否有显著差异。
如果p值小于0.05,我们拒绝零假设,认为两种教学方法在学生考试成绩上有显著差异。
如果p值大于或等于0.05,我们不能拒绝零假设,认为两种教学方法在学生考试成绩上没有显著差异。
8. 报告结果
在研究报告中,应详细记录研究设计、数据收集和分析方法、统计检验结果及其解释,以及研究的结论和教育实践的建议。确保报告中包含足够的细节,使其他研究者能够复制这项研究。
结语
06
无论是社会科学、生物医学、工程技术还是经济学的研究,正确评估数据的正态性和方差齐性都是关键步骤之一。深入理解并正确应用正态性和方差齐性的检验,是执行科学研究和得出可靠结论的基础,对于选择合适的统计测试方法、确保分析的准确性和可靠性以及正确解释研究结果至关重要。后续我们会继续介绍其他统计学知识,敬请关注!
相关文章
统计学入门(1)——描述统计与推断统计
统计学入门(2)——总体与样本
统计学入门(3):如何刻画数据——参数与统计量
统计学入门(4):数据的类别、来源与质量
统计学入门(5):数据类别与测量层次
统计学入门(6) - Z-score
统计学入门(7): T-score
统计学入门(8): F检验
参考文献
Analytixlabs. (2022). Parametric vs. Non-Parametric Test: Which One to Use for Hypothesis Testing? https://www.analytixlabs.co.in/blog/parametric-and-non-parametric-test/
Editage. (2023). Normality Test Explained: Methods Of Assessing Normality.
https://www.editage.com/blog/normality-test-methods-of-assessing-normality/
stackexchange. (2023). Interpreting the residuals vs. fitted values plot for verifying the assumptions of a linear model.
https://stats.stackexchange.com/questions/76226/interpreting-the-residuals-vs-fitted-values-plot-for-verifying-the-assumptions
公众号|语言科学漫谈